Міністерство освіти і науки, молоді та спорту України
Національний транспортний університет
Факультет транспортних та інформаційних технологій
Кафедра інформаційних систем і технологій
Лабораторна робота №2
з дисципліни
«Комп’ютерні технології статистичної обробки інформації»
на тему
«Побудова вибіркової функції розподілу засобами комп’ютерних технологій»
Київ – 2011
Лабораторна робота №2
Тема: побудова вибіркової функції розподілу засобами комп’ютерних технологій.
Мета: ознайомитися з методикою побудови вибіркових функцій розподілу в Excel з використанням інструменту Гістограма з Пакету аналізу і навчитися побудови гістограм в середовищі MathCAD.
Теоретична довідка
Побудова гістограм.
Гістограма – це графік, що дозволяє візуалізувати відносну частоту влучення даних експериментальної вибірки у визначений числовий інтервал. При її побудові область, обумовлена по розмаху значень даних у вибірці, розбивається на деяке невелике (6-20) число проміжків (як правило, рівних), і потім підраховується відсоток елементів, влучивших до кожного з них. Сама гістограма являє собою стовпчасту діаграму, ширина сегмента якої відповідає величині проміжку, а висота – відносної частості влучення в нього даних. Проводячи паралелі, можна сказати, що в статистиці гістограма є повним аналогом кривої щільності розподілу в теорії імовірностей. Відповідно площа всіх її стовпців повинна бути нормована і дорівнювати 1.
Побудова гістограм вручну – трудомістка і непроста задача. У MathCAD же, завдяки наявності спеціальних функцій, вона вирішується досить легко. Більш того, художній рівень отриманих графіків заслуговує самих високих оцінок. З огляду на практичну важливість статистичних діаграм, розглянемо техніку їх створення.
Гістограми з довільною шириною стовпців.
У MathCAD існують дві функції, що дозволяють зробити обробку вибірки для наступної побудови гістограм. Перша з них, що з'явилася в ранніх версіях програми, функція hist (intvls,x), більш складна у використанні, однак при її допомозі можна будувати гістограми з нерівною шириною сегментів.
Функція hist (intvls,x) – вектор частоти попадання даних в інтервали гістограми:
іntvls – вектор, елементи якого задають сегменти побудови гістограми в порядку зростання a<intvlsi<b;
х – вектор випадкових даних.
Якщо вектор intvls має bin елементів, то і результат hist має стільки ж елементів. Оскільки методика створення гістограм з використанням функції hist досить складна, надамо її по пунктах:
Для початку представимо експериментальні дані у вигляді вектора. На практиці це робиться або безпосереднім їхнім занесенням у таблицю введення (Input Таble), або читанням з текстового або Excel файлу. Щоб одержати передбачуваний результат, скористаємося одним з генераторів випадкових чисел MathCAD. Наприклад, задамо вектор з 1000 нормально розподілених випадкових величин з математичним сподіванням µ=3 і середньоквадратичним відхилення σ = 1 :
Визначимо кількість стовпців майбутньої гістограми. У загальному випадку для цього можна скористатися спеціальною формулою, що обчислює верхню границю числа сегментів для коректної гістограми (утім, в MathCAD це можна зробити і довільним чином):
Далі обчислимо ширину сегментів гістограми. Зазвичай вона визначає відношення розмаху даних у вибірці до числа стовпців гістограми. У MathCAD розмах даних у векторі можна обчислити за допомогою спеціальних матричних функцій max(х) і min(х), що повертають, відповідно, найбільший і найменший його елемент. Щоб обчислити крок сегмента максимально коректно, граничні значення варто округлити. Для цього можна використовувати спеціальні функції floor(a) і ceil(a), що підраховують верхню і нижню границі округлення для числа а:
Використовуючи ранжовану змінну, задаємо вектор границь сегментів розбивки. У загальному випадку його можна визначити довільним чином. Але оскільки на практиці гістограми будуються практично винятково зі стовпцями рівної ширини, то і наш вектор задамо таким чином, щоб різниця між його сусідніми елементами д...